Loading...
机构名称:
¥ 1.0

摘要:最近,人工智能生成图像质量评估(AIGCIQA)已成为计算机视觉领域的一个新课题,旨在从人类感知的角度评估人工智能生成的图像(AIGI)的质量。与常见的图像质量评估任务(其中图像来自受噪声、模糊和压缩等扭曲的原始图像)不同,在 AIGCIQA 任务中,图像通常由使用文本提示的生成模型生成。过去几年,人们做出了相当大的努力来推进 AIGCIQA。然而,大多数现有的 AIGCIQA 方法直接从单个生成的图像中回归预测分数,忽略了这些图像的文本提示中包含的信息。这种疏忽部分限制了这些 AIG-CIQA 方法的性能。为了解决这个问题,我们提出了一个基于文本图像编码器的回归(TIER)框架。具体而言,我们将生成的图像及其相应的文本提示作为输入,利用文本编码器和图像编码器分别从这些文本提示和生成的图像中提取特征。为了证明我们提出的 TIER 方法的有效性,我们在几个主流 AIGCIQA 数据库上进行了广泛的实验,包括 AGIQA-1K、AGIQA-3K 和 AIGCIQA2023。实验结果表明,我们提出的 TIER 方法在大多数情况下通常比基线表现出更好的性能。代码将在 https://github.com/jiquan123/TIER 上提供。

arXiv:2401.03854v2 [cs.CV] 2024 年 1 月 11 日

arXiv:2401.03854v2 [cs.CV] 2024 年 1 月 11 日PDF文件第1页

arXiv:2401.03854v2 [cs.CV] 2024 年 1 月 11 日PDF文件第2页

arXiv:2401.03854v2 [cs.CV] 2024 年 1 月 11 日PDF文件第3页

arXiv:2401.03854v2 [cs.CV] 2024 年 1 月 11 日PDF文件第4页

arXiv:2401.03854v2 [cs.CV] 2024 年 1 月 11 日PDF文件第5页

相关文件推荐

2024 年
¥3.0
2024 年
¥6.0
2024 年
¥3.0
2024 年
¥13.0
2024 年
¥1.0
2024 年
¥1.0